C-SAKey : une approche de découverte de clés conditionnelles dans des données RDF

نویسندگان

  • Nathalie Pernelle
  • Danai Symeonidou
  • Fatiha Saïs
چکیده

Résumé : L’exploitation des liens d’identité entre ressources RDF permet aux applications de combiner des données issues de différentes sources. Les approches permettant de lier des données sont largement fondées sur l’existence de clés éventuellement composites. Ces clés étant rarement disponibles, des approches récentes se sont intéressées à la découverte automatique de clés à partir de données RDF. Cependant, dans certains domaines, les classes de l’ontologie sont très générales et les clés valides pour tout l’ensemble d’instances d’une classe sont peu nombreuses. Aussi, dans l’approche C-SAKey, nous proposons de détecter des clés conditionnelles qui ne s’appliqueront qu’à un sousensemble des instances d’une classe. Nous avons réalisé une première expérimentation sur un jeu de données de l’INA qui montre que les clés découvertes par notre approche peuvent effectivement varier selon les conditions exprimées dans la clé. Mots-clés : Intégration de données, Liens d’identité, Liage de données, Clés, RDF, OWL

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Découverte de proportions analogiques dans les bases de données : une première approche

Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions...

متن کامل

Découverte des dépendances fonctionnelles conditionnelles fréquentes

Résumé. Les Dépendances Fonctionnelles Conditionnelles (DFC) ont été introduites en 2007 pour le nettoyage des données. Elles peuvent être considérées comme une unification de Dépendances Fonctionnelles (DF) classiques et de Règles d’Association (RA) puisqu’elles permettent de spécifier des dépendances mixant des attributs et des couples de la forme attribut/valeur. Dans cet article, nous trait...

متن کامل

Détection de clefs pour l'interconnexion et le nettoyage de jeux de données

Résumé : Cet article propose une méthode d’analyse de jeux de données du Web publiés en RDF basée sur les dépendances de clefs. Ce type particulier de dépendances fonctionnelles, largement étudié dans la théorie des bases de données, permet d’évaluer si un ensemble de propriétés constitue une clef pour l’ensemble de données considéré. Si c’est le cas, il n’y aura alors pas deux instances posséd...

متن کامل

SPARQL Template : un langage de pretty printing pour RDF

RDF est un langage de représentation de connaissances basé sur des graphes étiquetés, conçu par le W3C pour le Web sémantique et le Web des données. En tant que langage d’échange pivot, il peut être utilisé pour représenter des arbres de syntaxe abstraite (AST) de langages. Par exemple le langage OWL a plusieurs syntaxes dont une syntaxe fonctionnelle et une syntaxe RDF, de même que le langage ...

متن کامل

Graphes de voisinage pour l'indexation et l'interrogation d'images par le contenu

Résumé. La découverte d’informations cachées dans les bases de données multimédias est une tâche difficile à cause de leur structure complexe et à la subjectivité liée à leur interprétation. Face à cette situation, l’utilisation d’un index est primordiale. Un index multimédia permet de regrouper les données selon des critères de similarité. Nous proposons dans cet article d’apporter une amélior...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015